首页> 外文OA文献 >Batch Incremental Shared Nearest Neighbor Density Based Clustering Algorithm for Dynamic Datasets
【2h】

Batch Incremental Shared Nearest Neighbor Density Based Clustering Algorithm for Dynamic Datasets

机译:基于批量增量共享最近邻密度的聚类   动态数据集的算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Incremental data mining algorithms process frequent updates to dynamicdatasets efficiently by avoiding redundant computation. Existing incrementalextension to shared nearest neighbor density based clustering (SNND) algorithmcannot handle deletions to dataset and handles insertions only one point at atime. We present an incremental algorithm to overcome both these bottlenecks byefficiently identifying affected parts of clusters while processing updates todataset in batch mode. We show effectiveness of our algorithm by performingexperiments on large synthetic as well as real world datasets. Our algorithm isup to four orders of magnitude faster than SNND and requires up to 60% extramemory than SNND while providing output identical to SNND.
机译:增量数据挖掘算法通过避免冗余计算来有效地处理动态数据集的频繁更新。现有基于共享最近邻密度的聚类(SNND)算法的增量扩展无法处理数据集的删除,并且一次只能处理一个点。我们提出了一种增量算法,通过在批处理模式下处理对数据集的更新时有效地识别集群的受影响部分,从而克服了这两个瓶颈。我们通过对大型合成数据集和现实世界数据集进行实验来证明算法的有效性。我们的算法比SNND快四个数量级,并且比SNND最多需要60%的额外内存,同时提供与SNND相同的输出。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号